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摘要 : [目的 /意义 ] 将 科研 团 
新 的 影响 ， 有 助 于 提升 科研 
建立 科研 团队 规模 、 科 研 团 
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队 与 算法 创新 结合 ， 从 科研 
团队 的 学 术 能 力 ， 进 而 促 i 
队 机 构 数 量 、 科 研 团队 机 构 类 型 三 个 科研 团 


法 性 能 与 学 术 产 出 两 个 算法 
团队 为 


列 ， 运 用 非 参 数 检验 、 
提出 增强 科 和 下 


创新 评价 指标 。 以 机 器 学 习 领 域 
多 元 线性 回归 模型 探索 科研 团队 特 
团队 科研 表现 、 促 进 算 法 再 创新 的 
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近年 来 ， 以 算法 和 大 数据 为 基础 的 数字 技术 在 社会 各 领域 快速 应 用 
技术 正 推动 着 人 类 社会 的 智能 化 革命 ， 


Fa 


法 规制 的 上 杂 
大 会 上 


下 ， 


上 度 创 新 中 .情报 


t 有 显著 影响 效应 ， 混 合 型 科 
法 论文 被 引 量 上 表现 最 优 ， 科 研 团队 规模 对 算法 性 能 及 学 术 产 出 均 存在 正 向 影响 ， 科 
团队 机 构 数 量 对 学 术 产 出 世 性 能 的 影响 呈 负 相关 。 
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阿里 巴巴 集团 副 总 裁 俞 , 
以 算法 为 核心 的 计算 机 科学 研究 成 为 学 术 界 的 新 焦点 ， 


研 团队 在 算法 模型 准确 率 
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开发 新 的 算法 模型 ， 发 展 新 
科学 太 
作 ， 借 助 科 研 
团队 为 形式 的 全 

虽然 团 
战 ， 如 团队 成 员 多 样 化 、 深 


团队 的 形式 ， 依 靠 
法 研究 逐渐 兴 
队 合作 能 够 帮助 科研 人 员 在 科学 创新 上 实现 突破 ， 但 合作 过 程 
层次 的 知识 整合 、 大 规模 、 目 标 差异 性 、 开 放 式 边界 、 地 域 分 


的 算法 应 用 ， 为 


Do 
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为 社会 发 展 增加 了 巨大 动能 李 安 . 
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2017,61(05):87-94.。 目 前 已 有 多 项 研究 表明 ， 团 队 特征 〈 如 规模 、 机 构 或 国家 多 样 性 等 ) 


对 研究 成 果 的 影响 力 、 质 量 、 新 颖 性 等 具有 显著 影响 Uzzi B, Mukherjee S, Stringer M, et al. 


Atypical Combinations and Scientific Impact[J]. Science, 2013, 342(6157):468-472. 。 换 言 之 ， 科 
研 团队 的 内 部 环境 与 条 件 对 算法 创新 也 具有 一 定 影响 。 然 而 ， 大 部 分 研究 仍 将 算法 视 为 理 
性 客观 的 技术 模型 ， 并 因此 忽略 算法 本 身 仍然 可 能 具有 的 多 样 性 ， 以 及 这 种 多 样 性 受到 环 
境 因素 影响 而 发 展演 化 的 复杂 性 贾 开 .算法 社会 的 技术 内 涵 、 演 化 过 程 与 治理 创新 品 . 探 索 ， 
2022,No.224(02):164-178.， 而 且 算法 不 是 简单 而 客观 的 指令 ， 算 法 和 人 之 间 的 关系 不 能 忽 
视 宋 错 业 .“ 算 法 ”与 国家 治理 创新 一 一 数据 、 算 法 与 权力 的 知识 生产 与 逻辑 呈现 叮 . 科 学 学 
研究 ,2022,40(03):401-409.。 

综 上 所 述 ， 虽 然 科研 团队 与 算法 的 研究 已 兴起 ， 但 二 者 尚未 结合 起 来 ， 特 别 是 研究 科 
研 团队 特质 对 算法 创新 影响 的 研究 范 吴 , 李 珊 丙 , 热 孜 亚 : 艾 海 提 . 机 器 学 习 算法 在 我 国情 报 学 
研究 中 的 应 用 与 影响 一 一 基于 cssc 期 刊 论文 的 视角 叫 . 图 书 情报 知识 ,2022,39(05):96-108.。 
科研 团队 对 算法 研究 会 产生 怎样 的 影响 ， 科 研 团队 特质 与 算法 创新 之 间 具 有 怎样 的 关系 ， 
目前 还 没有 统一 的 结论 。 基 于 此 ， 本 研究 试图 从 科研 团队 特质 的 角度 探索 算法 创新 背后 的 
驱动 力 ， 主 要 目的 在 于 提升 科研 团队 的 学 术 能 力 ， 进 而 促进 算法 创新 、 科 学 创新 。 


2 相关 研究 述评 


N 21 ”科研 团队 特质 测度 指标 相关 研究 


>< 针对 科研 团队 特质 以 及 其 对 科研 团队 产 出 成 果 的 影响 问题 ， 国 内 外 学 者 提出 了 一 系列 
= 8 标 来 进行 定量 测度 ， 主 要 关注 科研 团队 的 规模 特质 、 结 构 特质 、 类 型 特质 等 等 。 

首先 ， 团 队 规模 特质 的 量化 较为 直接 ， 科 研 团 队 中 科研 人 员 的 数量 即 为 科研 团队 规 

模 ， 通 常会 使 用 最 大 值 、 最 小 值 、 平 均值 等 统计 变量 。 除 此 之 外 ， 曾 德 明 等 曾 德 明 , 张 志 东 ， 

王 泓 略 .高 校 科 研 团 队 规模 优化 研究 串 . 湖 南大 学 学 报 (社会 科学 版 )202135(03):75-79. 构 建 了 

基于 净 夏 普 利 值 (Shapley Value) 的 科研 团队 规模 测定 方法 ， 以 动态 的 视角 分 析 了 影响 科 

研 团队 最 优 规模 的 因素 。 其 次 ， 机 构 特质 与 国 别 特质 。 雇 青云 等 廖 青云 , 朱 东 华 , 汪 雪 锋 , 黄 

颖 .科研 团队 的 多 样 性 对 团队 绩效 的 影响 研究 [. 科 学 学 研究 ,2021,39(06):1074-1083. 在 研究 科 

研 团队 的 多 样 性 对 团队 绩效 的 影响 时 ， 提 出 了 机 构 多 样 性 与 国 别 多 样 性 两 个 指标 。 再 次 ， 

科研 团队 的 学 科 特 质 。 科 研 团队 的 学 科 特 质 即 科研 团队 的 跨 学 科 性 ， 以 团队 成 员 所 属 学 科 

为 基本 单元 ， 从 团队 整体 视角 计算 科研 团队 的 跨 学 科 性 。 在 跨 学 科 测度 上 ， 张 琳 等 张 琳 , 孙 

蓓 蓓 ,黄蜂 . 跨 学 科 合作 模式 下 的 交叉 科学 测度 研究 一 一 以 Es 社会 科学 领域 高 被 引 学 者 为 例 

吕 .情报 学 报 ,2018,37(03):231-242. 提 出 了 基于 合 著 机 构 地 址 提取 学 科 分 类 的 方法 ， 从 而 测度 

科学 合作 中 的 不 同学 科 机 构 之 间 的 学 科 交 叉 程度 。Tanmoy Chakraborty 等 ChakrabortyT 


Ganguly N, Mukherjee A. Rising popularity of interdisciplinary research - An analysis of citation 
networks[C]// 2014.38 Fe Wit BEG SCHR SE EH PRX E Fs BES VO SCS SB EE TT 


量化 。 最 后 是 科研 团队 常见 的 其 他 特质 。Dae Sung Lee “# Lee D S, Lee K C, Seo Y W. An 


analysis of shared leadership, diversity, and team creativity in an e-learning environment{J]. 
Computers in Human Behavior, 2015, 42: 47-56.36 Fi MY & PEMET BOT ET ADA FE ae SA 

性 别 特质 、 专 业 特 质 、 角 色 特 质 。 李 纲 等 李纲 , 刘 先 红 . 科 研 团队 中 学 术 带 头 人 的 合作 特征 及 
其 对 科研 产 出 的 影响 吕 . 情 报 理论 与 实践 ,2016,39(06):70-75. 从 人 员 角 度 和 成 果 角度 选取 了 相 
关 指 标 来 测度 学 术 带 头 人 的 合作 特征 ， 以 探究 其 对 科研 产 出 的 影响 。Yi Bu 等 Bu Y Zhang C, 


Huang Y, et al. Investigating scientific collaboration through the sequence of authors in the 


publication bylines and the diversity of collaborators[C]// 2019. 在 研究 科学 团队 的 合作 模式 
时 ， 通 过 主题 多 样 性 与 影响 多 样 性 两 个 维度 对 合作 者 的 多 样 性 进行 了 量化 ， 同 样 属 于 科研 
团队 的 合作 特质 。 

综 上 ， 除 团队 规模 外 ， 现 如 今 团 队 结构 、 团 队 类 型 等 特质 在 研究 划分 时 多 有 重合 交叉 
现象 。 科 研 团 队 特 质 本 质 上 也 没有 统一 的 划分 方式 ， 研 究 者 多 根据 自身 的 研究 内 容 与 主题 
侧重 不 同 的 角度 进行 划分 。 在 本 研究 中 ， 科 研 团队 特质 主要 包括 科研 团队 规模 、 科 研 团队 
机 构 数 量 、 科 研 团队 机 构 类 型 三 个 维度 ， 并 将 通过 一 系列 可 量化 的 指标 去 测度 科研 团队 特 
质 。 


2.2 算法 创新 评价 指标 相关 研究 


虽然 学 界 没有 对 算法 创新 进行 统一 的 定义 ， 但 其 内 涵 是 较为 清晰 的 。 在 本 研究 中 ， 算 
法 模型 每 一 次 性 能 的 提升 、 改 进 与 优化 即 被 认为 实现 了 一 次 算法 创新 ， 算 法 创新 的 评价 指 
标 在 一 定 程度 上 与 算法 性 能 的 评价 指标 无 异 。 由 于 算法 模型 应 用 领域 的 多 样 性 ， 科 学 家 会 
在 不 同 的 环境 中 部 署 不 同 任务 最 适合 的 算法 Hill R K. What an algorithm is[J]. Philosophy & 
Technology 2016, 29(1): 35-59.， 因 此 ， 算 法 性 能 的 评价 指标 也 具有 多 样 性 、 差 异性 。 

经 文献 调研 发 现 ， 准 确 率 李 志 义 , 许 洪 凯 , 段 斌 .基于 深度 学 习 CNN 模型 的 图 像 情感 特征 
抽取 研究 吊 . 图 书 情报 工作 ,2019,63(11):96-107.、 精 确 率 翟 羽 佳 , 田 静 文 , 赵 表 .基于 BERT- 
BiLSTM-CRF 模型 的 算法 术语 抽取 与 创新 演化 路 径 构建 研究 [. 情 报 科 学 ,2022,40(04):71-78.、 
召回 率 翟 羽 佳 , 田 静 文 , 赵 表 .基于 BERT-BiLSTM-CRF 模型 的 算法 术语 抽取 与 创新 演化 路 径 构建 
研究 叫 . 情 报 科学 ,2022,40(04):71-78.、F1 值 翟 羽 佳 , 田 静 文 , 赵 表 .基于 BERT-BiLSTM-CRF 模型 
的 算法 术语 抽取 与 创新 演化 路 径 构 建 研究 趾 . 情 报 科学 ,2022,40(04):71-78.、 平 均 精度 Ridnik 


T, Sharir G, Ben-Cohen A, et al. Ml-decoder: Scalable and versatile classification 


head[C]//Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision. 


2023: 32-41.、 均 值 平均 精度 RidnikT Sharir G, Ben-Cohen A, et al. Ml-decoder: Scalable and 


versatile classification head[C]//Proceedings of the IEEE/CVF Winter Conference on Applications 
of Computer Vision. 2023: 32-41. 等 是 机 器 学 习 算 法 中 最 常见 的 几 种 评价 指标 ， 大 量 的 算法 模 
型 研究 中 会 使 用 以 上 指标 进行 评价 ， 并 且 以 上 评价 指标 大 部 分 用 于 图 像 分 类 、 图 像 识别 、 
图 像 分 割 、 目 标 检测 等 任务 中 。 针 对 不 同 的 研究 问题 与 应 用 场景 ， 学 者 们 也 会 提出 其 他 的 


评价 指标 。Wen Jing Kang 等 Kang W J, Liu C, Liu G L. A quantitative attribute-based benchmark 


methodology for single-target visual tracking[J]. Frontiers of Information Technology & Electronic 


Engineering, 2020, 21(3):405-421. 为 了 测试 单 目 标 视觉 跟踪 算法 的 各 方面 性 能 ， 设 定 了 照明 
变化 、 尺 寸 变 化 、 目 标 移动 长 度 等 指标 ， 并 对 其 进行 了 定量 处 理 。Bryar A. Hassan 等 


Hassan B A, Rashid T A. Operational framework for recent advances in backtracking search 


optimisation algorithm: A systematic review and performance evaluation[J]. Applied 
Mathematics and Computation, 2020, 370: 124919. 在 比较 回溯 搜索 优化 算法 与 其 他 四 种 竞争 
算法 的 性 能 时 ， 从 初始 化 参数 、 问 题 维 度 、 搜 索 空间 和 问题 队列 四 个 指标 维度 进行 了 分 


析 。DuraipandianDuraipandian M. Performance evaluation of routing algorithm for Manet based 


on the machine learning techniques[J]. Journal of trends in Computer Science and Smart 
technology (TCSST), 2019, 1(01): 25-38. 基 于 传输 延 人 运 、 传 输 过 程 中 消耗 的 能 量 和 数据 包 投 递 

率 三 个 指标 评估 了 MANET 路 由 算法 性 能 ， 并 与 其 他 方法 进行 了 比较 。 
虽然 算法 偏重 应 用 ， 但 学 术 论 文 是 其 进行 传播 、 扩 散 的 一 个 重要 渠道 。 因 此 ， 除 了 从 
算法 性 能 评价 指标 的 角度 衡量 算法 创新 外 ， 学 术 产 出 评价 角度 也 是 算法 创新 评价 的 一 个 音 
分 。 学 术 产 出 评价 包括 对 产 出 数量 与 产 出 质量 的 定性 评价 和 定量 评价 。 定 性 评价 主要 采用 
同行 评议 方法 对 论文 的 创新 性 、 科 学 性 、 实 用 性 等 论文 内 部 指标 进行 评价 哭 祺 海 , 荆 林 波 . 哲 
学 社会 科学 期 刊 定量 和 定性 评价 问题 分 析 及 对 策 研究 叫 . 中 国 社会 科学 院 大 学 学 报 ， 
则 主要 依靠 论文 被 引 频次 、 期 刊 影响 因子 、H 指数 等 


指标 。 论 文 被 引 频 次 最 早 由 GarfieldGarfield E. Citation indexes for science: A new dimension in 


2022,42(10):44-55+141-142.。 定 量 评价 由 


documentation through association of ideas[J]. Science, 1955, 122(3159): 108-111. 提 出 ， 如 今 已 
成 为 公认 的 论文 定量 评价 指标 之 一 。 本 研究 也 将 主要 依靠 这 一 指标 完成 学 术 产 出 评价 角度 
的 算法 创新 评价 。 


2.3 科研 团队 特质 对 算法 创新 的 影响 相关 研究 


目前 ， 科 研 团队 与 算法 的 研究 都 还 局 限 在 各 自 的 领域 内 ， 以 算法 科研 团队 或 算法 成 果 
的 影响 因素 为 主题 的 研究 还 较 少 ， 下 文 梳理 了 涉及 科研 团队 产 出 评价 、 算 法 科研 团队 、 机 
器 学 习 领 域 创 新 影响 因素 等 研究 。 

首先 ， 有 关 科 研 团队 及 其 特质 对 科研 产 出 影响 的 研究 有 黄 明 方 等 黄 昱 方 , 俞 蔚 . 团 队 知识 


共享 结构 与 团队 绩效 一 一 团队 情绪 的 中 介 作 用 喇 . 情 报 杂 志 ,2016,35(10):166-172. 运 用 社会 网 


络 方法 建构 团队 知识 共享 网 络 ， 并 运用 结构 方程 模型 对 知识 共享 结构 、 团 队 情结、 团队 绩 
效 之 间 的 关系 进行 了 检验 ， 挖 掘 对 团队 绩效 产生 正 负面 影响 以 及 中 介 作 用 的 团队 特质 。 王 
磊 等 王 椅 , 李 浴 霞 .团队 特征 对 高 校 科研 团队 个 体 创造 力 影响 的 跨 层 次 研究 一 一 以 团队 知识 整 
合 能 力 为 中 介 变 量 叫 . 软 科学 ,2016,30(09):75-78+89. 对 高 校 科研 团队 个 体 创造 力 的 影响 因素 
进行 研究 ， 基 于 问卷 调查 与 多 层 线性 模型 ， 得 出 部 分 影响 因素 对 高 校 科 研 团队 个 体 创造 力 
的 正 向 影响 效应 。 其 次 ， 有 关 算 法 科研 团队 或 人 工 智能 领域 科研 团队 的 研究 有 王 日 芬 等 王 
日 芬 , 杨 雪 , 余 厚 强 , 曹 嘉 君 .人 工 智 能 科研 团队 的 合作 模式 及 其 对 比 研究 叫 . 图 书 情报 工作 ， 
2020,64(20):14-22. 以 人 工 智 能 领域 领军 团队 为 研究 对 象 ， 根 据 团 队 中 学 者 的 合作 人 数 情况 
和 社会 网 络 指标 ， 对 科研 团队 的 合作 模式 进行 划分 ， 并 探究 在 所 研究 维度 上 表现 较为 优异 
的 团队 模式 。 同 时 还 有 分 本 涛 等 邹 本 涛 , 王 日 芬 , 余 厚 强 . 人 工 智 能 领域 高 产科 研 团 队 的 演化 
研究 叫 . 图 书 情报 工作 ,2020,64(20):23-33. 发 现 人 工 智 能 领域 高 产 团 队 中 各 时 期 的 “小 团体 ” 


ag 合作 现象 显著 。Piorkowski 等 Piorkowski D, Park S, Wang AY, et al. How Al Developers 


“z 


Overcome Communication Challenges in a Multidisciplinary Team: A Case Study[J]. 2021. 指 出 人 
工 智能 开发 人 员 在 开发 过 程 中 可 能 存在 的 沟通 挑战 ， 殉 服 沟通 障碍 是 缓解 开发 人 员 心 理 差 
距 的 关键 。 最 后 ， 有 关 科 学 创新 影响 因素 的 研究 有 吕 冬 晴 等 吕 冬 晴 , 阮 选 敏 ,李江 ,成 颖 . 跨 学 
科 知 识 融合 对 D 指数 的 影响 串 . 情 报 学 报 ,2022,41(03):263-274. 以 神经 科学 领域 论文 为 研究 对 
象 ， 采 用 Logistic 回归 分 析 方法 ， 探 索 学 术 论 文 跨 学 科 性 对 其 创新 程度 的 影响 。 杜 杏 叶 等 
杜 杏 叶 , 李 贺 , 李 卓 卓 . 面 向 知识 创新 的 科研 团队 数据 能 力 模 型 构建 研究 趾 . 图 书 情报 工作 ，, 
2018,62(04):28-36. 研 究 了 数据 密集 型 科研 环境 下 影响 科研 团队 知识 创新 的 核心 要 素 ， 提 出 
了 促进 知识 创新 的 科研 团队 数据 能 力 模 型 ， 进 而 明确 核心 要 素 中 促进 科研 团队 知识 创新 的 
要 能 

总 体 而 言 ， 虽 然 科 研 团 队 与 算法 的 研究 已 兴起 ， 但 将 两 者 结合 起 来 并 探索 科研 团队 特 
质 对 算法 创新 的 影响 的 研究 尚未 形成 统一 的 结论 。 科 研 合 作 越 来 越 普遍 的 情况 下 ， 科 研 团 
队 对 于 科学 研究 的 进步 与 发 展 的 影响 愈加 明显 ， 科 研 团队 的 研究 不 应 再 局 限于 宏观 层面 的 
建设 管理 研究 ， 应 聚焦 于 微观 层面 更 具体 、 更 有 针对 性 的 研究 。 对 于 算法 研究 来 说 ， 算 法 
创新 不 仅仅 受到 算法 模型 内 部 参数 、 训 练 情况 的 影响 ， 外 部 环境 因素 也 会 影响 其 最 终 效 
果 ， 为 了 算法 创新 水 平 的 不 断 提 高 ， 有 必要 对 其 影响 因素 进行 深入 分 析 。 


Urli 
A 


x 


3 研究 设计 与 数据 处 理 


本 研究 以 机 器 学 习 领 域 的 科研 团队 与 算法 为 研究 对 象 ， 将 以 Papers With 
Code、Scinapse 以 及 Semantic Schola 三 个 网 站 上 获取 到 的 科研 团队 信息 、 算 法 信息 为 数据 
集 ， 从 多 个 角度 探索 两 者 之 间 的 关系 。 有 具体 而 言 ， 首 先 ， 收 集 数 据 ， 分 析 本 研究 中 科研 团 
队 的 特质 ， 在 此 基础 上 ， 建 立 科研 团队 特质 的 测度 指标 与 算法 创新 的 评价 指标 ， 其 次 ， 运 
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用 非 参 数 检验 、 多 元 线性 回归 模型 探索 科研 团队 特质 对 算法 创新 的 影响 ， 最 后 ， 根 据 前 述 
分 析 结 果 进 行 总 结 ， 以 此 为 依据 提出 增强 科研 团队 科研 表现 、 促 进 算法 再 创新 的 建议 。 

本 研究 选取 的 算法 模型 来 自 Papers With Code 平台 上 Computer Vision 〈 即 计算 机 视 
觉 ) 领域 下 的 Image Classification (BURR) 任务 。 随 着 互联 网 多 媒体 技术 的 快速 发 展 
和 数码 设备 的 普及 ， 图 像 数据 大 量 涌现 ， 利 用 计算 机 自动 识别 图 像 内 容 并 分 类 的 方法 应 运 
而 生 ， 目 前 已 有 越 来 越 多 的 算法 模型 应 用 于 此 Error: Reference source not found。 因 此 ， 本 
研究 选择 以 图 像 分 类 任务 中 的 计算 机 算法 科研 团队 为 研究 对 象 具有 一 定 的 代表 性 。 

本 研究 所 用 的 数据 主要 来 自 Papers With Code. Scinapse 以 及 Semantic Scholar 三 个 平 
台 。 获 取 数 据 的 过 程 主要 依靠 息 虫 与 人 工 收集 两 个 渠道 。 第 一 步 ， 利 用 把 虫 在 Papers With 
Code 平台 搜集 算法 模型 与 论文 信息 ， 采 和 集 的 字段 包括 算法 模型 名 称 、 准 确 率 、 参 数量 、 算 
法 论文 题目 、 发 表 年 份 等 。 第 二 步 ， 在 Scinapse 网 站 中 根据 采集 到 的 论文 题目 ， 补 充 论文 
作者 信息 ， 包 括 论文 作者 姓名 、 机 构 信 息 、H 指 数 ， 此 步 又 可 同时 获得 作者 数量 、 机 构 数 
量 信息 。 第 三 步 ， 根 据 采集 到 的 论文 题目 ， 在 Semantic Scholar 网 站 ， 以 论文 题目 为 检索 
项 进行 搜索 ， 补 充 论文 被 引 量 信息 。 需 要 说 明 的 是 ， 由 于 本 研究 所 选 论文 存在 无 法 检索 到 
以 及 信息 不 全 面 的 情况 ， 所 以 某 些 论文 作者 与 机 构 信 息 需 要 查看 论文 原文 获得 ， 同 时 ， 作 
者 五 指数 获取 依靠 了 Scinapse 与 Semantic Scholar 两 个 平台 。 至 此 ， 本 研究 共 获取 851 个 科 
研 团队 的 相关 信息 ， 包 括 科 研 团队 规模 、 科 研 团队 机 构 数 量 、 科 研 团队 机 构 类 型 、 科 研 团 
队 成 员 平均 bh 指数 、 算 法 模型 准确 率 、 参 数量 、 算 法 论文 题目 、 算 法 论文 发 表 年 份 、 算 法 
论文 被 引 量 等 信息 。 

接 下 来 ， 将 数据 导入 Stata 中 进行 数据 预 处 理 。 首 先 ， 由 于 Papers With Code 网 站 收录 
的 算法 模型 参数 量 会 有 缺失 ， 所 以 需要 将 存在 缺失 值 的 数据 条 目 删 除 ， 另 外 ， 经 过 对 数据 
的 整理 ， 发 现 个 别论 文 的 被 引 量 存在 极端 值 ， 属 于 不 常见 现象 ， 为 了 将 研究 结果 推广 到 尽 
可 能 大 的 范围 中 ， 并 且 保 证 不 会 对 最 终 的 研究 结果 有 很 大 影响 的 情况 下 ， 本 研究 对 此 类 数 
据 也 进行 了 剔除 。 经 过 对 缺失 值 与 异常 值 的 处 理工 作 ， 最 终 获得 有 效 数 据 543 条 ， 后 续 将 
以 此 为 样本 进行 实证 分 析 。 
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实证 样本 
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| 搜集 算法 模 再 
I 与 论文 信息 
| 
| 


| 


1 

| 

| 

一 
补充 论文 | 缺失 值 、 异 常 值 
作者 信息 1 HE => 处 理 

| 

| 

| 

| 


| 


补充 论文 
| 被 引 量 信息 


图 1 数据 获取 与 预 处 理 流程 图 


4 科研 团队 特质 对 算法 创新 的 影响 模型 构建 


4.1 科研 团队 特质 测度 指标 建立 


参考 以 往 研 究 对 科学 团队 的 定义 ， 本 研究 对 科研 团队 的 界定 为 由 两 位 及 以 上 科研 人 员 
组 成 ， 以 共同 解决 科学 研究 问题 为 目标 ， 共 同 合作 并 得 到 科学 论文 产 出 的 研究 群体 。 以 本 
研究 为 例 ， 一 篇 算法 创新 科学 论文 的 所 有 作者 即 可 视 为 一 个 科研 团队 ， 更 具体 地 说 ， 可 称 
为 算法 科研 团队 。 经 过 对 科研 团队 特质 测度 指标 相关 研究 的 梳理 与 整合 ， 结 合 本 研究 的 内 
容 与 特点 ， 建 立 科研 团队 规模 、 科 研 团 队 机 构 数量 、 科 研 团 队 机 构 类 型 三 个 科研 团队 测度 


指标 。 


(1) 科研 团队 规模 


科研 团队 成 员 的 数量 对 于 科研 团队 的 产 出 是 有 影响 的 ， 在 不 考虑 科研 团队 内 部 合作 氛 
围 与 沟通 交流 效果 的 情况 下 ， 科 研 团队 的 成 员 越 多 ， 整 个 团队 能 发 挥 的 力量 就 越 大 ， 团 队 
产 出 效果 可 能 也 就 越 好 。 因 此 ， 科 研 团 队 规模 是 科研 团队 研究 中 最 基本 也 是 不 可 忽视 的 一 
个 测度 指标 。 本 研究 中 科研 团队 的 规模 情况 如 图 表 1、 图 2 所 示 。 由 图 表 可 知 ，543 个 算法 
科研 团队 的 平均 规模 为 6 人 左右 ， 最 小 的 仅 为 2 人 ， 最 大 的 达到 了 29 人 。 总 体 来 看 ， 科 研 


团队 规模 大 多 分 布 在 3-8 人 区 间 内 ， 占 总 体 数 量 的 83.4%， 其 中 规模 为 6 人 的 科研 团队 数量 


最 多 ， 为 103 个 ， 超 过 12 人 的 团队 数量 微乎其微 。 可 见 ， 在 科研 团队 规模 构成 中 ， 存 在 术 
对 适宜 的 团队 规模 ， 科 研 团 队 规模 的 把 控 对 于 后 续 开 展 科学 研究 也 十 分 重要 。 


表 1 科研 团队 规模 描述 性 统计 表 
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图 2 科研 团队 规模 分 布 直方 图 


(2) 科研 团队 机 构 数量 


在 算法 研究 领域 ， 互 联网 企业 、 人 工 智 能 公司 与 高 校 的 合作 不 断 增 强 ， 科 研 团队 呈现 
出 多 机 构 、 跨 单位 的 组 成 特点 。 不 同 能 力 与 背景 的 科研 机 构 之 间 的 合作 无 疑 会 对 科研 团队 
的 整体 科研 水 平 产生 影响 。 因 此 ， 科 研 团 队 中 各 种 机 构 的 数量 也 是 本 研究 关注 的 焦点 之 
一 。 本 研究 中 科研 团队 的 机 构 数量 情况 如 表 2、 图 3 所 示 。 由 图 表 可 知 ， 机 构 数量 为 2 个 的 
科研 团队 数量 最 多 ， 为 216 个 ， 也 有 超过 30% 的 科研 团队 机 构 数量 为 1 个 ， 即 团队 所 有 成 
员 来 自 同一 机 构 ， 没 有 开展 跨 机 构 科 研 合作 。 总 体 来 看 ， 除 去 少数 科研 团队 机 构 数 量 达到 
4 个 以 上 外 ， 科 研 团队 机 构 数量 整体 在 各 个 团队 间 的 差距 不 大 。 


K 2 科研 团队 机 构 数量 描述 性 统计 表 


图 3 科研 团队 机 构 数量 分 布 图 


(3) 科研 团队 机 构 类 型 


当前 ， 越 来 越 多 的 互联 网 企业 、 人 工 智能 公司 迁 勃 发 展 具 有 开展 科学 研究 的 能 力 ， 并 
与 高 校 进行 科研 合作 。 因 此 ， 本 研究 试图 根据 科研 团队 中 成 员 所 属 机 构 的 类 型 ， 将 科研 团 
队 进 行 划 分 ， 以 研究 不 同类 型 的 科研 团队 在 算法 创新 方面 的 表现 。 

科研 团队 机 构 类 型 的 划分 方法 如 下 : 若 科研 团队 中 所 有 成 员 第 一 单位 属于 企业 或 企业 
附属 研究 所 ， 那 么 将 其 认定 为 企业 型 科研 团队 。 若 科研 团队 中 所 有 成 员 第 一 单位 属于 高 


校 ， 那 么 将 其 认定 为 高 校 型 科研 团队 。 若 科研 团队 中 既 有 成 员 第 一 单位 属于 企业 或 企业 附 
属 研究 所 ， 也 有 成 员 第 一 单位 属于 高 校 ， 那 么 将 其 认定 为 混合 型 科研 团队 。 本 研究 中 科研 
团队 机 构 类 型 情况 如 表 3、 图 4 所 示 。 由 图 表 可 知 ， 企 业 型 、 高 校 型 、 混 合 型 科研 团队 的 
数量 占 比 分 别 为 30%、15%、55%。 混 合 型 科研 团队 的 数量 与 占 比 最 高 ， 且 超过 了 企业 型 
与 高 校 型 科研 团队 之 和 ， 反 映 出 当下 科研 团队 校 企 合作 的 热门 趋势 ， 而 在 企业 型 与 高 校 型 
两 种 科研 团队 中 ， 企 业 型 科研 团队 数量 与 占 比 远 远 大 于 高 校 型 科研 团队 ， 显 示 出 如 今 人 工 
智能 企业 的 强大 竞争 力 。 


O 


表 3 科研 团队 机 构 类 型 情况 表 
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图 4 科研 团队 机 构 类 型 分 布 图 


4.2 算法 创新 评价 指标 建立 


(1) 算法 模型 准确 率 


依 前 文 所 述 ， 算 法 创新 的 评价 指标 很 大 程度 上 与 算法 性 能 的 测度 指标 无 异 。 对 于 一 个 
算法 模型 而 言 ， 其 每 一 次 性 能 的 提升 、 效 果 的 改善 都 可 以 认为 是 一 次 创新 。 因 此 ， 算 法 性 
能 指标 是 本 研究 在 评价 算法 创新 时 考虑 的 第 一 个 角度 。 本 研究 选择 的 算法 模型 ， 其 性 能 评 
价 指 标 主要 包括 Topl Accuracy. Top5 Accuracy, Number of params 等 。 在 图 像 分 类 过 程 
中 ， 模 型 预测 某 张 图 片 时 ， 会 给 出 预测 为 某 些 类 别 的 概率 ， 并 按 概率 从 高 到 低 将 类 别 进 行 
排名 。Topl Accuracy 与 Top5 Accuracy 就 分 别 指 预测 概率 排名 第 一 的 类 别 与 实际 结果 相符 
的 准确 率 、 预 测 概率 排名 前 五 的 类 别 包含 实际 结果 的 准确 率 。Number of params 指 模型 中 
使 用 的 参数 量 。 由 于 数据 来 源 中 提供 的 Topl Accuracy 与 Number of params 两 项 指标 数据 较 
为 齐全 ， 因 此 ，Topl Accuracy〔 以 下 简称 准确 率 ，ACC) 将 作为 本 研究 评价 算法 创新 的 指 
标 之 一 ，Number of params (以 下 简称 参数 量 ，NOP) 将 作为 控制 变量 加 入 影响 模型 中 。 
表 4 列 出 了 本 研究 中 算法 模型 的 准确 率 情况 。 由 表 4 可知 ，543 个 算法 模型 的 平均 准确 
率 为 81.9%， 达 到 了 较 高 水 平 ， 最 小 值 为 61.5%， 最 大 值 为 91.1%Chen X, Liang C, Huang D, 
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jani 
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et al. Symbolic Discovery of Optimization Algorithms[J]. arXiv preprint arXiv:2302.06675, 2023., 
研究 选取 的 算法 模型 跨度 达 10 年 ， 说 明 10 年 间 算 法 模型 的 性 能 提升 是 显著 的 。 图 5 直观 
展示 了 2018-2022 年 间 算 法 模型 准确 率 的 上 升 趋势 。 


表 4 算法 模型 准确 率 描述 性 统计 表 


算法 模型 数 标准 
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图 5 算法 模型 准确 率 变化 图 


(2) ”算法 论文 被 引 量 


被 引 量 是 文献 计量 学 中 被 用 来 测度 学 术 论 文 的 社会 显示 度 和 学 术 影响 力 的 一 项 重要 指 

标 。 依 据 规范 理论 的 指引 ， 先 前 的 研究 中 常 将 被 引 频 次 视 为 创新 的 蔡 代 指标 ， 高 被 引 成 为 
B 
forward: collaboration and creativity[J]. American journal of preventive medicine, 2008, 35(2): 
S243-S249.。 算 法 模型 不 断 改良 的 过 程 中 伴随 着 学 术 论文 的 产 出 ， 论 文成 为 了 算法 模型 传播 
扩散 的 有 效 载体 ， 算 法 论文 的 被 引 量 越 高 ， 说 明 算 法 论文 的 影响 力 越 强 ， 进 而 反映 出 算法 
模型 的 创新 性 也 越 强 。 因 此 ， 算 法 模型 所 属 论文 的 被 引 量 可 以 侧面 体现 该 算法 的 创新 性 ， 
本 研究 据 此 选择 了 论文 被 引 量 〈Cited Quantity, CIT) 这 一 指标 用 来 从 学 术 产 出 的 角度 评价 
算法 创新 。 
表 5 列 出 了 本 研究 中 算法 论文 的 被 引 量 情况 。 由 表 可 知 本 研究 选取 的 算法 论文 平均 被 
引 量 为 137.2， 最 大 值 为 997， 相 对 来 说 属于 较 高 水 平 ， 但 由 于 论文 发 表 年 限 的 不 同 、 算 法 
模型 本 身 性 能 高 低 的 不 同 ， 算 法 论文 之 间 的 被 引 量 差距 相对 来 说 也 较 大 。 由 于 论文 被 引 旱 
只 累 需 要 时 间 ， 发 表 年 份 早 的 论文 相对 来 说 被 引 量 较 高 。 图 6 展示 了 算法 论文 被 引 量 的 分 
布 情况 ， 从 图 中 可 以 看 到 ， 多 数论 文 的 被 引 量 在 400 以 内 ， 还 有 一 定数 量 的 论文 处 于 待 引 
用 的 状态 中 。 


(一 


新 成 果 的 基本 特征 Hall KL, Feng A X, Moser R P, et al. Moving the science of team science 


表 5 算法 论文 被 引 量 描述 性 统计 表 


算法 论文 数 | 7 a 
S 平均 值 | 中 位 数 | 最 小 值 | 最 大 值 | e 
E: 

543 | 137.2 | 57 | o | 947 | 1926 
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图 6 算法 论文 被 引 量 分 布 图 


4.3 科研 团队 特质 对 算法 创新 的 影响 模型 构建 


《1) 科研 团队 机 构 类 型 对 算法 创新 的 影响 模型 构建 


由 于 本 研究 中 算法 准确 率 与 论文 被 引 量 均 不 呈 标 准 正 态 分 布 ， 且 科研 团队 机 构 类 型 属 
率 、 被 引 量 与 科研 团队 机 构 类 型 之 间 的 关系 时 ， 采 用 非 参 


于 多 分 类 变量 ， 因 此 在 分 析 准 


人 
全 


数 检 验 中 的 Kruskal-Wallis 检验 Error: Reference source not found。 检 验 过 程 分 为 两 个 模型 分 


别 进行 ， 模 型 1 中 自 变量 为 科 


率 〈Accuracy ，ACC ) , 


考察 每 组 数据 的 正 态 性 ， 然 后 ， 使 有 


研 团 队 机 构 类 型 (Type Of Institution, TOI) ， 因 变量 为 准确 


模型 2 中 自 变 量 为 科研 团队 机 构 类 型 (Type Of 
Institution, TOI) ， 因 变量 为 论文 被 引 量 〈Cited Quantity, CIT) 。 
检验 过 程 主要 分 为 以 下 几 步 : 首先 ， 使 用 Shapiro-Wilk 检验 和 绘 


关 箱 型 图 的 方法 分 别 


H Levene 检验 进行 方差 齐 性 检验 ， 最后， 数据 既 不 服从 


正 态 分 布 ， 也 不 满足 方差 齐 性 的 情况 下 ， 进 行 Kruskal-Wallis 检验 ， 并 依据 检验 结果 做 出 统 
计 性 推断 。 模 型 与 检验 过 程 示意 


模型 1 


模型 2 


图 如 下 所 示 。 


1.Shapiro-Wilk 检 验 
2.Levene 检 验 


3.Kruskal-Wallis 检 验 


Asse: ACC 
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图 7 £H 
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队 机 构 类 型 对 算法 创新 的 影响 模型 示意 


PI 


(2) 科研 团队 规模 、 机 构 数量 对 算法 创新 的 影响 模型 构建 


本 文 将 基于 多 元 线性 回归 方法 构建 科研 团队 规模 、 机 构 数量 对 算法 创新 的 影响 模型 。 
由 于 本 文 从 算法 性 能 与 学 术 产 出 两 个 角度 衡量 算法 创新 ， 因 此 需 建 立 两 个 多 元 回归 模型 进 
行 分 析 ， 分 别 定 义 为 模型 3 算法 性 能 ， 因 变量 为 准确 率 ) ， 模 型 4 (学 术 产 出 ， 因 变量 为 
被 引 量 ) ， 两 个 模型 中 均 包 含 科研 团队 规模 (Team Size, TMS) 、 科 研 团队 机 构 数 量 
(Number Of Institution，NOI) 两 个 自 变 量 。 

在 多 元 线性 回归 模型 中 ， 为 了 使 自 变量 对 因 变 量 的 解释 作用 更 强 ， 通 常 需 加 入 一 些 控 
制 变量 提升 回归 模型 的 性 能 。 随 着 年 份 的 增加 ， 算 法 模型 往往 呈现 出 更 好 的 性 能 ， 同 时 ， 
论文 被 引 量 的 积累 需要 时 间 ， 普 遍 来 说 ， 论 文 发 表 年 份 越 早 ， 论 文 的 被 引 量 就 越 高 ， 因 此 
年 份 对 算法 性 能 和 论文 被 引 量 均 会 产生 影响 ， 需 将 论文 发 表 年 份 〈Year，YEA) 作为 控制 
变量 ， 同 时 加 入 两 个 模型 中 。 除 此 之 外 ， 对 于 模型 3〈 算 法 性 能 ) 而 言 ， 算 法 模型 在 测试 
与 建立 的 过 程 中 ， 算 法 模型 所 使 用 的 参数 量 是 影响 算法 模型 最 终 表 现 的 一 种 重要 因素 。 因 
此 ， 算 法 模型 参数 量 (Number Of Parameter，NOP， 单 位 为 M) 与 论文 发 表 年 份 被 选 做 模 
型 3 的 两 个 控制 变量 。 对 于 模型 4〈 学 术 产 出 ) 而 言 ， 在 研究 论文 被 引 量 的 影响 因素 时 ， 
常用 瑟 指 数 作为 一 个 计量 指标 ，h 指数 与 论文 被 引 量 之 间 存 在 的 强 相关 关系 已 得 到 证 实 。 
为 了 控制 旦 指数 对 于 论文 被 引 量 产 生 的 影响 ， 本 研究 对 科研 团队 内 所 有 成 员 的 H BCR F 
均 ， 将 得 到 的 团队 成 员 平均 瑟 指 数 〈Average H Index, AHI) 作为 模型 4 的 另 一 控制 变量 


a 


a 


本 研究 算法 模型 参数 量 与 团队 成 员 平均 五 指数 的 数值 情况 如 表 6 所 示 。 算 法 模型 参数 
量 的 平均 值 为 175.9M 个 ， 即 1.759 亿 个 ， 最 小 值 为 1.2M 个 ， 即 120 万 个 ， 可 见 ， 算 法 模 
型 所 用 的 参数 量 是 相当 庞大 的 。 团 队 成 员 平均 五 指数 的 平均 值 为 22.6， 最 小 值 为 2.5， 最 大 
值 为 66.5， 不 同 团队 之 间 存 在 一 定 差距 。 


表 6 算法 模型 参数 量 与 团队 成 员 平均 联 指 数 描述 性 统计 表 


平均 


值 
算法 模型 参数 量 10000 | 666.1 
五 队 成 员 平均 卫 指 数 12.1 
基于 对 自 变 量 、 因 变量 与 控制 变量 的 梳理 ， 本 研究 建立 如 下 两 个 多 元 回归 模型 来 验证 


科研 团队 规模 、 科 研 团 队 机 构 数量 对 科研 团队 算法 创新 的 影响 。 
模型 3 〈 算 法 性 能 ) : 


(4.1) 

为 了 准确 地 分 析 科 研 团 队 规模 、 机 构 数量 对 科研 团队 算法 创新 的 影响 ， 采 用 层次 回归 

的 方式 来 进行 分 析 。 模 型 M1 由 控制 变量 论文 发 表 年 份 YEA) 和 因 变 量 准确 率 (ACC) 

组 成 ，M2 在 M1 基础 上 增加 了 参数 量 (NOP) ，M3 在 M2 基础 上 增加 了 团队 规模 
(TMS) , M4 在 M3 的 基础 上 增加 了 机 构 数 量 NOD ， 其 中 -为 回归 系数 ， 为 误差 项 。 

模型 4〈 学 术 产 出 


| 


WY 


(4.2) 

模型 4 同样 采用 层次 回归 的 方式 来 进行 分 析 。 模 型 M5 由 控制 变量 论文 发 表 年 份 
CYEA) 和 因 变 量 论文 被 引 量 CCIT) 组 成 ， M6、M7 与 M8 分 别 在 上 一 个 模型 的 基础 上 增 
加 了 团队 成 员 平 均 卫 指数 (AHI)〉、 团 队 规模 (TMS) 、 机 构 数量 NOD ， 其 中 -为 回归 
系数 ， 为 误差 项 。 


图 8 科研 团队 规模 、 机 构 数 量 对 算法 创新 影响 模型 示意 图 


5 科研 团队 特质 对 算法 创新 的 影响 研究 


基于 算法 创新 的 两 个 评价 角度 ， 本 文 将 分 别 研究 科研 团队 特质 对 算法 性 能 与 算法 论文 
被 引 量 的 影响 。 主 要 过 程 为 首先 将 数据 导入 Stata 软件 中 ， 其 次 编写 非 参数 检验 与 多 元 线性 
回归 命令 并 和 运行， 最 后 对 得 出 结果 进行 分 析 。 


5.1 科研 团队 机 构 类 型 对 算法 创新 的 影响 研究 


(1) 科研 团队 机 构 类 型 对 算法 性 能 的 影响 


本 文 将 科研 团队 机 构 类 型 划分 为 企业 型 、 高 校 型 、 混 合 型 三 种 类 型 。 根 据 Kruskal- 
Wallis 检验 的 原理 ， 在 进行 分 析 前 ， 需 考察 每 组 数据 的 正 态 性 。 本 研究 使 用 Shapiro-Wilk 检 
验 进行 正 态 性 检验 。 


表 7 ACC 正 态 性 检验 结果 


组 别 ae | | | 一 Prob>z 
企业 型 3.314 | 0.00046% 
高 校 型 0.00006*** 
混合 型 4704 | 0.00000*** 
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YE: ***pP<0.01， 即 在 0.01 水 平 : 


企业 型 高 校 型 混合 型 


图 9 准确 率 箱 型 图 


表 7 按照 组 别 列 出 了 三 组 数据 的 准确 率 正 态 性 检验 结果 ， 可 知 三 组 的 P 值 分 别 为 
0.00046、0.00006 和 0.00000， 均 小 于 0.01， 结 合 图 9 所 示 箱 型 图 ， 可 确认 三 组 数据 不 服从 
标准 正 态 分 布 ， 方 差 齐 性 检验 结果 中 F=3.088，P=0.046 二 0.05， 提 示 三 组 数据 方差 不 齐 ， 
综 上 可 以 进行 Kruskal-Wallis 检验 。 


表 8 ACC Kruskal-Wallis 检验 结果 


组 别 ACC 均值 Kruskal-Wallis H P 
企业 型 0.821 


0.791 35.072 0.0001*#* 
混合 型 0.825 


YE: ***pP<0.01， 即 在 0.01 水 平 显 著 


Kruskal-Wallis 检验 结果 表 8 所 示 。 可 以 看 出 ，P<0.01， 说 明 算法 模型 准确 率 在 不 同 的 
组 别 之 间 存 在 显著 性 差异 。 也 就 是 说 ， 科 研 团队 机 构 类 型 对 于 算法 性 能 上 共有 影响 效应 。 结 
合 不 同 组 别 的 ACC 均值 可 知 ， 混 合 型 科研 团队 在 算法 模型 准确 率 上 的 表现 优 于 其 余 两 种 科 
研 团队 ， 但 与 企业 型 科研 团队 之 间 的 差距 很 小 ， 三 者 之 中 ， 高 校 型 科研 团队 的 算法 模型 准 
确 率 最 低 ， 与 另外 两 种 科研 团队 相差 了 约 3 个 百分点 ， 反 映 出 当下 高 校 科 研 团队 在 算法 研 
完 中 的 竞争 力 较 弱 ， 研 究 过 程 可 能 遇 到 了 瓶颈 ， 而 企业 型 团队 成 员 的 存在 对 于 算法 模型 准 
确 率 的 提高 有 一 定 推动 作用 。 


《2) 科研 团队 机 构 类 型 对 学 术 产 出 的 影响 


同样 的 ， 根 据 Kruskal-Wallis 检验 的 原理 ， 在 进行 分 析 前 ， 先 考察 每 组 数据 的 正 态 性 ， 
检验 过 程 仍然 使 用 Shapiro-Wilk 检验 进行 正 态 性 检验 。 


表 9 CIT 正 态 性 检验 结果 
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企业 型 高 校 型 混合 型 


图 10 被 引 量 箱 型 图 


表 9 按照 组 别 列 出 了 三 组 数据 论文 被 引 量 的 正 态 性 检验 结果 ， 可 知 三 组 的 P 值 均 小 于 
0.01， 结 合 图 10 所 示 箱 型 图 ， 可 确认 三 组 数据 不 服从 标准 正 态 分 布 ， 方 差 齐 性 检验 结果 中 
F=5.327，P=0.005 二 0.01， 提 示 三 组 数据 方差 不 齐 ， 综 上 可 以 进行 Kruskal-Wallis 检验 。 


表 10 CIT Kruskal-Wallis 检验 结果 


本 P 
r 

一 0.0001+#* 
混合 型 299 


YE: ***P<0.01, BNE 0.01 水 平 显著 


Kruskal-Wallis 检验 结果 表 10 所 示 。 可 以 看 出 ，P<0.01， 说 明 论 文 被 引 量 在 不 同 的 组 别 
之 间 存 在 显著 性 差异 ， 也 就 是 说 ， 科 研 团队 机 构 类 型 对 于 算法 论文 被 引 量 也 有 具有 影响 效 
应 。 结 合 不 同 组 别 的 CIT 均值 可 知 ， 企 业 型 科研 团队 在 算法 论文 被 引 量 上 的 表现 优 于 其 他 
两 种 科研 团队 类 型 ， 这 与 算法 模型 准确 率 的 结果 不 一 致 。 但 从 论文 被 引 量 上 来 看 ， 高 校 型 
科研 团队 的 算法 论文 被 引 量 在 三 种 类 型 团队 中 仍然 是 最 低 的 ， 与 另外 两 种 团队 的 差距 也 较 
大 ， 且 未 达到 总 体 样 本 的 平均 值 。 总 体 来 看 ， 混 合 型 科研 团队 与 企业 型 科研 团队 都 在 某 一 
方面 达到 了 最 优 ， 而 无 论 是 算法 模型 准确 率 还 是 算法 论文 被 引 量 ， 混 合 型 与 企业 型 科研 团 
队 都 要 高 于 高 校 型 科研 团队 ， 因 此 ， 高 校 算 法 科研 团队 如 何 提升 自身 竞争 力 是 未 来 研究 值 
得 关注 的 一 点 。 


5.2 ”科研 团队 规模 、 机 构 数量 对 算法 创新 的 影响 研究 


本 贡 将 应 用 多 元 线性 回归 方法 继续 探究 科研 团队 规模 、 机 构 数量 对 算法 创新 的 影响 。 


《1) 科研 团队 规模 、 机 构 数量 对 算法 性 能 的 影响 


表 11 以 ACC 为 因 变量 的 多 元 回归 结果 


0.018" 0.017** 0.016"** 
| o ë 


0.000*** 0.000*** 
EE H 0.003*** 
| 


| = | | eee 
129.74" 99.28 72.30" 
0.192 0.266 0.283 


YE: *P<0.1, **P<0.05, ***P<0.01, BHÆ 0.1, 0.05, 0.01 水 平 显 著 


科研 团队 规模 、 机 构 数量 对 算法 模型 准确 率 的 多 元 线性 回归 结果 保留 三 位 小 数 》 如 
表 11 所 示 。 由 模型 M4 回归 结果 可 知 ， 科 研 团队 规模 对 算法 性 能 的 回归 系数 为 0.003， 且 
在 1% 的 水 平 上 显著 ， 说 明科 研 团队 规模 与 算法 模型 准确 率 呈 正 相 关 ， 即 科研 团队 规模 对 算 
法 性 能 具有 正 向 促进 作用 。 科 研 团 队 机 构 数量 对 算法 模型 准确 率 的 回归 系数 为 -0.005， 
在 1% 水 平 上 显著 ， 说 明科 研 团 队 机 构 数量 与 算法 性 能 呈 负 相关 。 进 一 步 比 较 自 变量 的 回归 
系数 ， 团 队 机 构 数量 回归 系数 的 绝对 值 大 于 团队 规模 回归 系数 的 绝对 值 ， 说 明 团 队 机 构 数 
量 对 算法 性 能 的 影响 大 于 团队 规模 的 影响 。 论 文 发 表 年 份 、 算 法 模型 参数 量 组 成 的 控制 变 
量 在 1% 水 平 也 具有 统计 显著 性 ， 说 明年 份 与 参数 量 对 算法 性 能 确实 存在 影响 。 

除 此 之 外 ， 本 文 对 回归 结果 的 优 劣 和 多 重 共 线 性 问题 进行 检验 ， 包 括 计 算 判 定 系数 
R?、F 值 、VIF 值 。 由 表 11 可 知 ， 多 元 线性 回归 模型 M1-M4 的 值 均 在 P<0.01 水 平 上 显 
著 ， 说 明 自 变量 与 因 变 量 之 间 存 在 线性 关系 。 在 逐步 增加 变量 的 过 程 中 ，R? 的 值 不 断 增 
加 ， 自 变量 对 因 变 量 的 拟 合 程度 不 断 增加 ，M4 模型 中 的 R? 为 0.293， 说 明 算 法 性 能 中 有 大 
约 29.3% 的 变异 可 由 模型 M4 中 的 自 变 量 和 因 变 量 解释 。 根 据 多 重 共 线 性 的 检验 结果 ， 得 
知 模型 M4 中 自 变量 与 控制 变量 的 方差 膨胀 因子 分 别 为 1.18、1.10、1.08、1.02， 均 小 于 
10， 说 明 没有 多 重 共 线性 问题 ， 回 归结 果 可 靠 。 


中 


(2) 科研 团队 规模 、 机 构 数量 对 学 术 产 出 的 影响 


由 于 论文 被 引 量 不 符合 标准 正 态 分 布 Thelwall M. Are the discretised lognormal and 


hooked power law distributions plausible for citation data?[J]. Journal of Informetrics, 2016, 


10(2): 454-470.， 所 以 在 回归 分 析 前 要 进行 一 定 的 处 理 。ThelwallThelwall M, Wilson P. 


Regression for citation data: An evaluation of different methods[J]. Journal of Informetrics, 2014, 
8(4): 963-971. 的 研究 表明 ， 将 论文 被 引 量 加 1 再 取 对 数 后 作为 模型 的 因 变量 ， 再 采用 一 般 
线性 (普通 最 小 二 乘法 ) 模型 进行 回归 分 析 是 一 种 较 好 的 策略 。 因 此 ， 本 研究 以 
Ig 《CIT+1)〉 作 为 回归 模型 的 因 变 量 ， 构 建 多 元 线性 回归 模型 进行 分 析 。 


= 


#12 以 lg (CIT+1) 为 因 变 量 的 多 元 回归 结果 


CIT M8 
YEA -0.382*** 
AHI | -| ooe | ooge O 0.018*** 
TMS Po 0.033 O 0.027** 
NOI SSE = SE ee 0.055* 
F-value 70.61*#* 
Adj R? 0.340 


YE: *P<0.1, **P<0.05, ***P<0.01, BU ZE 0.1, 0.05. 0.01 水 平 显 著 


多 元 线性 回归 结果 (保留 三 位 小 数 ) 如 表 12 所 示 。 由 模型 M8 回归 结果 可 知 ， 科 研 团 
队 规 模 对 论文 被 引 量 的 回归 系数 为 0.027， 且 在 5% 的 水 平 上 显著 ， 说 明科 研 团 队 规模 与 算 
法 论文 被 引 量 之 间 有 正 相 关 关 系 ， 即 科研 团队 规模 对 学 术 产 出 具有 正 向 促进 作用 。 科 研 团 
队 机 构 数量 对 论文 被 引 量 的 回归 系数 为 0.055， 且 在 10% 水 平 上 显著 ， 说 明科 研 团 队 机 构 数 
量 与 论文 被 引 量 之 间 的 关系 也 呈正 相关 。 进 一 步 比 较 发 现 自 变 量 机 构 数量 的 回归 系数 大 于 
团队 规模 的 回归 系数 ， 说 明科 研 团 队 机 构 数量 对 学 术 产 出 的 影响 大 于 团队 规模 的 影响 。 由 
论文 发 表 年 份 、 团 队 平均 五 指数 组 成 的 控制 变量 在 1% 水 平 也 具有 统计 显著 性 ， 其 中 ， 年 
份 回归 系数 <0， 年 份 与 论文 被 引 量 间 的 关系 为 负 相 关 ， 符 合 实际 规律 ， 团 队 平 均 五 指数 回 
归 系 数 >0， 验 证 了 瑟 指 数 对 论文 被 引 量 的 正 向 影响 。 

HX 12 可 知 ， 多 元 线性 回归 模型 M5-M8 的 上 值 均 在 P<0.01 水 平 上 显著 ， 说 明 自 变量 
与 因 变 量 之 间 的 线性 关系 成 立 。 在 逐步 增加 变量 的 过 程 中 ， 团 队 平 均 孔 指数 的 加 入 使 得 R? 
的 值 增加 较 多 ， 自 变量 对 因 变 量 的 拟 合 程度 不 断 增加 ，M8 模型 中 的 R? 为 0.340， 说 明 学 术 
产 出 中 有 大 约 34% 的 变异 可 由 团队 规模 、 团 队 机 构 数 量 、 团 队 平 均 瑟 指数 、 论 文 发 表 年 份 
解释 。 根 据 多 重 共 线 性 的 检验 结果 ， 模 型 M8 中 自 变量 与 控制 变量 的 方差 膨胀 因子 分 别 为 
1.11、1.11、1.05、1.04， 均 小 于 10， 说 明 没 有 多 重 共 线性 问题 ， 回 归结 果 可 靠 。 


a 


5.3 结果 分 析 与 讨论 


C1) 科研 团队 机 构 类 型 对 算法 创新 具有 影响 效应 ， 混 合 型 科研 团队 在 算法 模型 性 能 上 
的 表现 优 于 高 校 型 与 企业 型 ， 而 企业 型 科研 团队 在 算法 论文 被 引 量 上 高 于 其 他 两 种 科研 团 
队 类 型 。 
从 算法 性 能 上 讲 ， 温 合 型 科研 团队 表现 更 好 ， 这 与 Martinez-Plumed 等 Martínez- 


Plumed F Barredo P Heigeartaigh S O, et al. Research community dynamics behind popular Al 


benchmarks[J]. Nature Machine Intelligence, 2021, 3(7): 581-589. 得 到 的 “混合 ”团体 在 最 先进 
的 模型 领域 占据 主导 地 位 的 研究 结果 一 致 。 一 方面 混合 型 科研 团队 拥有 来 自 高 校 与 企业 的 
高 质量 算法 研究 人 才 。 算 法 模型 性 能 的 提升 就 是 企业 的 本 质 目标 ， 企 业 不 断 地 挖掘 能 力 强 
的 研究 人 员 加 入 团队 之 中 ， 相 对 于 高 校 而 言 ， 企 业 科 研 团队 成 员 可 能 更 能 专注 于 算法 研 
究 。 男 一 方面 ， 混 合 型 科研 团队 拥有 算法 研究 所 需 的 硬件 与 资源 。 如 今 的 算法 研究 对 设备 
的 要 求 非常 高 ， 企 业 成 员 携 带 的 资金 与 设备 可 以 为 研究 提供 有 力 支 持 ， 进 而 产 出 有 竞争 力 


的 科研 成 果 。 尽 管 混合 型 科研 团队 的 优势 明显 ， 但 由 于 高 校 与 企业 属于 不 同 的 社会 领域 ， 
两 者 合作 也 存在 合作 流程 复杂 性 、 目 标 一 人 臻 性、 技术 方法 可 行 性 等 挑战 ， 因 此 ， 做 好 控 和 
与 管理 对 于 项 目的 成 功 至 关 重 要 Gersdorf T, He V F, Schlesinger A, et al. Demystifying industry— 


= 


academia collaboration[J]. Resource, 2019, 23: 22.4.. 

从 学 术 产 出 上 讲 ， 企 业 型 科研 团队 的 算法 论文 被 引 量 超过 了 高 校 型 与 混合 型 科研 团 
队 ， 这 与 本 研究 预期 不 相符 。 出 现 这 一 现象 的 原因 可 能 在 于 ， 一 方面 ， 本 研究 中 涉及 到 的 
企业 大 多 为 大 型 互联 网 企业 并 且 长 期 从 事 算法 研究 ， 从 研究 年 限 的 角度 ， 它 们 更 易 积累 更 
多 的 论文 被 引 量 ， 而 混合 型 科研 团队 提出 的 算法 模型 虽然 相对 来 说 更 为 优异 ， 但 性 能 更 好 
的 算法 模型 提出 的 年 份 相对 更 新 ， 被 引 量 的 积累 需要 一 定 的 年 份 ， 因 此 可 能 造成 被 引 量 相 
对 较 低 。 男 一 方面 ， 企 业 型 科研 团队 的 规模 一 般 较 另外 两 类 更 大 ， 团 队 成 员 的 互相 引用 行 
为 也 可 能 会 在 一 定 程度 上 提升 该 团队 论文 的 被 引 量 。 

vT (2) 科研 团队 规模 与 算法 性 能 正 相 关 ， 机 构 数量 与 算法 性 能 负 相 关 。 
0 科研 团队 规模 与 算法 性 能 正 相 关 ， 与 本 研究 预期 相符 。 算 法 性 能 的 提升 依靠 多 方面 、 
多 领域 的 知识 技能 ， 团 队 规模 增加 能 在 一 定 程度 上 满足 团队 的 知识 需求 ， 完 成 既定 科研 目 
标 与 解决 复杂 问题 的 能 力也 更 强 ， 因 此 ， 团 队 规模 的 增加 会 显著 提高 科研 团队 的 科研 产 出 
水 平 。 另 外 ， 科 研 任务 对 创新 性 要 求 相 对 较 高 郑 小 勇 ,楼 款 . 科 研 团 队 创新 绩效 的 影响 因素 及 
其 作用 机 理 研 究 叫 .科学 学 研究 ,2009,27(09):1428-1438.， 团 队 规 模 增 加 在 一 定 程度 上 也 能 为 
团队 的 创新 贡献 力量 。 
科研 团队 机 构 数量 与 算法 性 能 负 相 关 ， 这 一 结果 与 Cummings 等 Cummings J N, Kiesler 


S, Bosagh Zadeh R, et al. Group heterogeneity increases the risks of large group size: A 


© longitudinal study of productivity in research groups[J]. Psychological science, 2013, 24(6): 880- 
= 890. 的 结果 类 似 。 与 团队 规模 不 同 ， 科 研 团队 机 构 数量 的 增加 意味 着 团队 成 员 的 异 质 性 越 
© 来 越 强 ， 团 队 成 员 的 背景 、 个 性 、 偏 好 等 方面 融合 程度 更 低 ， 团 队 成 员 的 群体 认同 感 会 逐 
步 降 低 ， 在 合作 过 程 中 会 付出 更 多 的 沟通 成 本 。 尤 其 是 在 大 规模 的 团队 中 ， 虽 然 机 构 数量 
的 增加 可 能 会 形成 混合 型 团队 的 机 构 类 型 ， 但 机 构 数量 过 多 带 来 的 负 向 效果 最 终 会 超过 混 
合 型 团队 带 来 的 增益 效果 ， 导 致 科研 团队 整体 产 出 的 水 平 降低 。 同 时 ， 机 构 数 量 过 多 可 能 


会 形成 远程 团队 ，Yiling Lin 等 Lin Y, Frey C B, Wu L. Remote Collaboration Fuses Fewer 


Breakthrough Ideas[J]. arXiv preprint arXiv:2206.01878, 2022. 的 研究 则 表明 ， 远 程 团 队 不 太 可 
能 整合 现 有 知识 来 产生 新 的 、 突 破 性 的 想法 ， 这 对 于 算法 研究 是 不 利 的 。 

(3) 科研 团队 规模 与 学 术 产 出 正 相 关 ， 机 构 数 量 与 学 术 产 出 正 相关 。 

科研 团队 规模 与 学 术 产 出 正 相 关 ， 这 一 结果 与 张 玲玲 等 张 玲玲 , 王 蝶 , 张 利 斌 . 跨 学 科 性 
与 团队 合作 对 大 科学 装置 科学 效益 的 影响 研究 串 . 管 理 世界 ,2019,35(12):199-212. 的 研究 结果 
一 致 。 与 团队 规模 对 算法 性 能 的 正 向 促进 机 理 相 同 ， 团 队 规模 的 增加 ， 会 提升 团队 整体 的 
生产 能 力 ， 创 造 出 更 具 学 术 影 响 力 的 科研 成 果 ， 获 得 更 高 的 被 引 量 ， 同 时 也 可 能 受益 于 团 


队 成 员 的 互相 引用 行为 ， 使 得 论文 的 被 引 量 有 一 定 提升 。 

科研 团队 机 构 数量 对 学 术 产 出 的 影响 呈正 相关 ， 与 对 算法 性 能 的 影响 出 现 了 相反 作 
用 。 科 研 团队 机 构 数 量 的 增加 可 能 会 拓宽 论文 的 传播 渠道 ， 扩 大 研究 的 影响 范围 ， 使 得 论 
文 被 各 领域 、 各 机 构 的 科研 人 员 发 现 ， 这 增加 了 论文 被 引 的 可 能 性 。 此 外 ， 除 了 考虑 团队 
内 成 员 的 自 引 用 外 ， 也 可 以 考虑 科研 团队 成 员 所 属 机 构 之 间 的 互相 引用 行为 。Lariviere 等 


V Larivière, Gingras Y, Sugimoto C R , et al. Team size matters: Collaboration and scientific impact 


since 1900[J]. Journal of the Association for Information Science & Technology, 2014, 66(7). 的 研 
究 也 证 实 文章 署名 中 的 地 址 数量 有 助 于 文章 被 引 量 的 增加 。 


6 结语 


本 研究 运用 非 参 数 检验 、 多 元 线性 回归 等 方法 ， 建 立 了 科研 团队 特质 对 算法 创新 的 影 
响 模 型 ， 分 别 分 析 了 科研 团队 规模 、 机 构 数 量 、 机 构 类 型 对 算法 创新 的 影响 效应 ， 结 果 表 
明 : 
科研 团队 机 构 类 型 对 算法 创新 具有 显著 影响 效应 ， 不 同类 型 科研 团队 之 间 存 在 显著 性 差 
异 。 混 合 型 科研 团队 在 算法 模型 准确 率 上 的 表现 最 优 ， 企 业 型 科研 团队 在 算法 论文 被 引 量 
上 表现 最 优 ， 算 法 性 能 受 科 研 团队 规模 、 机 构 数量 的 影响 ， 同 时 ， 算 法 模型 参数 量 、 算 法 
论文 年 份 也 会 影响 算法 性 能 。 科 研 团 队 规模 对 算法 性 能 有 正 向 影响 ， 机 构 数量 对 算法 性 能 
存在 负 向 影响 ， 学 术 产 出 受 科 研 团队 规模 、 机 构 数量 的 影响 ， 同 时 ， 科 研 团队 平均 也 指 
数 、 算 法 论文 年 份 也 会 影响 学 术 产 出 ， 科 研 团 队 规模 与 学 术 产 出 之 间 有 正 相 关 关 系 ， 机 构 
数量 与 学 术 产 出 之 间 也 有 正 相 关 关 系 。 
结合 研究 结果 ， 本 文 提出 如 下 研究 启示 : 首先 ， 鼓 励 开 展 跨 机 构 研 究 ， 但 不 要 一 味 推 
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能 力 与 资金 设备 的 强 强 联合 ， 跨 机 构 合作 能 够 实现 优势 互补 、 资 源 共享 ， 产 出 更 具 竞 争 力 
的 校 企 合作 成 果 。 与 此 同时 ， 研 究 结果 也 表明 ， 企 业 型 科研 团队 在 算法 论文 被 引 量 上 也 县 
有 一 定 优 势 ， 说 明 跨 机 构 合作 不 一 定 会 带 来 “最 优 解 ”， 企 业 与 高 校 都 有 适合 自己 的 研究 
方式 。 因 此 ， 鼓 励 跨 机 构 研 究 的 同时 ， 要 尊重 单一 科研 团队 的 自主 研究 。 其 次 ， 优 化 团队 
结构 ， 强 化 团队 合作 。 研 究 指 出 ， 科 研 团队 规模 对 算法 创新 具有 正 向 影响 效应 ， 因 此 ， 在 
组 建 科研 团队 时 ， 可 以 适当 扩大 科研 团队 规模 ， 但 不 能 盲目 增加 成 员 人 数 ， 需 建立 一 定 的 
门槛 ， 防 止 出 现 团 队 团 队 结 构 过 于 复杂 影响 团队 交流 合作 的 现象 。 科 研 团 队 多 元 化 的 趋势 
下 ， 跨 机 构 、 跨 学 科 、 跨 地 域 等 合作 越 来 越 多 ， 团 队 成 员 的 背景 更 加 复杂 ， 为 了 使 团队 成 
员 更 有 动力 ， 要 加 强 团队 成 员 之 间 的 交流 ， 增 强 团队 成 员 的 认同 感 与 归属 感 ， 增 强 团 队 合 
作 意 识 ， 使 团队 具有 长 期 可 持续 发 展 的 能 力 。 最 后 ， 提 升 技术 水 平 ， 注 重创 新 思维 。 对 于 
算法 科研 团队 而 言 ， 算 法 研究 涉及 到 多 个 方面 的 知识 和 技能 ， 算 法 创新 的 成 效 很 大 程度 上 


取决 于 团队 成 员 的 技术 水 平 ， 因 此 可 以 通过 开展 技术 培训 、 学 习 交 流 等 活动 来 提高 团队 成 
员 的 技术 水 平 。 科 研 团队 还 应 该 关注 最 新 的 研究 动态 ， 不 断 更 新 知识 储备 ， 保 持 技术 领 
E。 此 外 ， 算 法 研究 是 一 个 不 断 创新 的 领域 ， 因 此 科研 团队 应 注重 创新 思维 ， 鼓 励 团 队 成 
尝试 新 的 想法 和 方法 ， 不 断 探 索 新 的 领域 和 技术 。 

本 研究 仍 存 在 一 些 不 足 之 处 。 首 先 ， 本 研究 选择 的 科研 团队 特质 测度 指标 与 算法 创新 
评价 指标 不 够 丰富 和 多 样 。 其 次 ， 本 研究 选取 的 是 机 器 学 习 领 域 图 像 分 类 下 的 算法 科研 团 
队 及 其 研究 论文 ， 得 到 的 部 分 结论 可 能 具有 领域 局 限 性 。 未 来 的 研究 中 可 以 增加 更 多 的 指 
标 ， 例 如 动态 测度 科研 团队 特质 的 流动 性 、 稳 定性 指标 等 ， 从 创新 扩散 的 角度 评价 算法 创 
新 的 指标 等 ， 使 指标 体系 更 全 面 ， 研 究 结果 更 加 合理 和 可 靠 。 同 时 ， 可 以 选取 多 领域 的 术 
出 科研 团队 进行 对 比 研究 ， 通 过 剖析 杰出 科研 团队 的 构成 规律 、 运 作 机 制 、 合 作 模 式 等 ， 
为 科学 家 间 的 合作 提供 新 的 思路 与 建议 ， 提 高 科研 团队 的 产 出 水 平 。 
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Algorithm Innovation Driven by the Characteristics of Scientific 
Research Teams 
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Abstract: [Purpose/Significance] Combining scientific research team with algorithmic 
innovation and exploring its influence on algorithmic innovation from the perspective of 
scientific research team traits can help improve the academic capacity of scientific research 
team, which in turn can promote algorithmic innovation and scientific innovation. 
[Method/Process] Three research team measures, namely, research team size, number of 
research team institutions, and research team institution type, and two algorithm innovation 
evaluation indexes, namely, algorithm performance and academic output, are established. 
Taking 543 scientific research teams under the image classification task in the field of 
machine learning as an example, non-parametric tests and multiple linear regression models 
were used to explore the effect of scientific research team traits on algorithm innovation, and 
suggestions to enhance the scientific research performance of scientific research teams and 
promote algorithm reinvention were proposed based on the empirical results. 
[Result/Conclusion] All of the research team characteristics measures have an effect on 
algorithm innovation, mainly: the type of research team institution has a significant effect on 
algorithm innovation, the hybrid research team has the best performance in algorithm model 
accuracy, and the enterprise research team has the best performance in algorithm paper 
citations; the research team size has a positive effect on algorithm performance and academic 
output; the research team The number of institutions has a positive effect on the academic 
output and a negative effect on the algorithm performance. 

Key words: Research team characteristics; Algorithm innovation; Nonparametric test; 
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